SWE-bench Lite adalah benchmark yang digunakan untuk mengukur kemampuan model AI dalam menyelesaikan tugas debugging perangkat lunak. Ini berisi serangkaian tugas yang dirancang untuk menguji efektivitas model dalam pemrograman.
Teknologi
2 bulan lalu
AI Masih Belum Bisa Menggantikan Ahli Manusia dalam Debugging Perangkat Lunak
Tentang Halaman Ini
SWE-bench Lite adalah benchmark yang digunakan untuk mengukur kemampuan model AI dalam menyelesaikan tugas debugging perangkat lunak. Ini berisi serangkaian tugas yang dirancang untuk menguji efektivitas model dalam pemrograman.